Geração de features para resolução de correferência: Pessoa, Local e Organização (Feature Generation for Coreference Resolution: Person, Location and Organization) [in Portuguese]
نویسندگان
چکیده
This work aims at resolving coreference in Portuguese, focusing on categories of named entities Person, Location and Organization. The proposed method uses supervised learning. To this end, the use of features that assist in the correct classification of named entities is critical. The construction and refinement of these features are of great relevance to his task. The performance of many other tasks depends on the correct output of coreference resolution systems, in special the extraction of relationships between named entities. Resumo. Este trabalho tem por objetivo a resolução de correferência em língua portuguesa, tendo como foco entidades nomeadas das categorias Pessoa, Local e Organização. O método proposto utiliza aprendizado supervisionado. Para tal, o uso de features que auxiliem na correta classificação das entidades nomeadas é fundamental. A construção e o refinamento dessas features são de grande relevância para essa tarefa. O desempenho de muitas outras tarefas depende da correta saída de sistemas de resolução de correferência, em especial, a extração de relação entre entidades nomeadas. 1. Introdução Este trabalho tem como foco a identificação de entidades nomeadas e suas cadeias de correferência. O objetivo principal é a resolução de correferências em língua portuguesa para os domínios Pessoa, Local e Organização. A resolução de correferências é uma tarefa relevante e também um grande desafio para a área de linguística computacional. Tratando-se da língua portuguesa, esse desafio é ainda maior. Isto é, a quantidade de recursos para a língua portuguesa é limitada se comparada com a quantidade de recursos que temos disponíveis para outras línguas, como o inglês. Collovini et al. (2011) propõem a extração de relação entre entidades nomeadas presentes em textos da língua portuguesa. A extração desse tipo de relação possui um impacto considerável para a área de processamento da linguagem natural, dado o fato que esse tipo de técnica pode melhorar a performance de muitas tarefas. Nesse contexto, a tarefa de reconhecimento de entidades nomeadas tem como objetivo identificar, desambiguar e atribuir uma categoria semântica a essas entidades, como pessoa, organização, entre outras. É nesse ponto que está a contribuição deste trabalho. Tendo textos como entrada, pretende-se gerar cadeias de correferência para categorias específicas de entidades nomeadas e, com isso, pretende-se contribuir para a extração de relações entre entidades, por meio de inferência. Gabbard et al. (2011) mostram que a resolução de correferência pode prover ganhos significativos para a extração de relação
منابع مشابه
Uso de Algoritmos Genéticos na Seleção de Atributos para Classificação de Regiões
The technological advances about remote sensing allows a better identification of urban targets in the images. The aim of this work is to classify automatically the urban spaces applying feature extraction and selection techniques, in high resolution images. To classify the road network and others urban components, some shape features that permit to recognize different objects with analogous sp...
متن کاملGeração de instruções em mundos virtuais: primeiros passos (Generation of Instructions in Virtual Worlds: First Steps) [in Portuguese]
The generation of navigational instructions in natural language concerns the computational task of producing sentences to guide a user to a target point in virtual or real worlds. This paper describes the development of a system of this kind, which will participate in a shared task, and it is intended to motivate further research in the field. Resumo. A geração de instruções de navegação em lı́n...
متن کاملCoreference Resolution for Portuguese: Person, Location and Organization
Coreference resolution is a process that consists in identifying the several forms that a specific entity may be referred to in a discourse. The automatic textual coreference resolution is a very important task in Natural Language Processing (NLP), because several others need its output. The present work shows a system for coreference resolution for Portuguese and its evaluation. The system sol...
متن کاملDetermination of Gold by High-Resolution Continuum Source Atomic Absorption Spectrometry with Chemical Vapor Generation
Avaliou-se o potencial analítico da geração de vapor químico e da espectrometria de absorção atômica com fonte contínua de alta resolução com atomização em tubo de quartzo na determinação de ouro. As espécies voláteis de ouro foram formadas pela reação com tetraidroborato(III) de sódio na presença de ácido clorídrico. Investigou-se a influência de brometo de didodecil dimetilamônio (DDAB) e die...
متن کاملGeração de Expressões de Referência usando Relações Espaciais (Referring Expression Generation Using Spatial Relations) [in Portuguese]
Instruction-giving systems for virtual interactive 3D worlds have a wide range of applications in education, games and others. This paper discusses the computational task of referring expression generation for systems of this kind, focusing on the use of spatial relations to describe domain objects. Resumo. Sistemas de geração de instruções em mundos virtuais interativos 3D possuem uma ampla ga...
متن کامل